谢赛宁盛赞字节Seed新研究!单Transformer搞定任意视图3D重建
架构足够简单,核心能力却不差。能从一张图、一组多视角照片甚至一段随手拍的视频里,精准算出物体深度、还原相机位置,不仅能拼出完整3D场景,还能脑补出没拍过的新视角图像。
视图 字节 transformer 赛宁 字节seed 2025-11-18 13:07 2
架构足够简单,核心能力却不差。能从一张图、一组多视角照片甚至一段随手拍的视频里,精准算出物体深度、还原相机位置,不仅能拼出完整3D场景,还能脑补出没拍过的新视角图像。
视图 字节 transformer 赛宁 字节seed 2025-11-18 13:07 2
最近,李飞飞、谢赛宁、Yann LeCun 等大佬频频提到一个词——空间智能(Spatial Intelligence)。它不是单纯“看懂图像或视频”,而是理解空间结构、记住发生的事情,并能预测未来。换句话说,真正的 AI 不只是“看见”,还要感知、理解,并主
前阵子,谢赛宁团队刚宣告在图像生成领域打拼多年的VAE正式“退役”,不少人还在琢磨这行业要变天,清华大学和快手可灵团队就带着新家伙接了棒。
VAE为何被接连抛弃?主要还是因为语义纠缠的缺陷——语义特征都放在同一个潜空间,调一个数值就会“牵一发而动全身”,比如只想改变猫的颜色,结果体型、表情都跟着变。
长期以来,扩散模型的训练通常依赖由变分自编码器(VAE)构建的低维潜空间表示。然而,VAE 的潜空间表征能力有限,难以有效支撑感知理解等核心视觉任务,同时「VAE + Diffusion」的范式在训练与推理效率上也存在显著瓶颈。
Rich Sutton 曾说过:「AI 只能在可以自我验证的范围内创造和维持知识。」爱因斯坦与英费尔德在合著的《物理学的进化》中也写道:「提出一个问题往往比解决问题更重要,后者或许仅仅是数学或实验技巧的问题。而提出新的问题、新的可能性,从新的角度审视旧的问题,
编程 赛宁 codeforces codeforces难题 2025-10-20 22:17 4
就在今天,纽约大学助理教授谢赛宁团队放出了新作 ——VAE 的替代解决方案 ——RAE(Representation Autoencoders,表征自编码器)。
在东方卫视9月16日播出的《这就是中国》节目中,复旦大学中国研究院院长张维为教授与埃及开罗大学中文系主任、开罗大学孔子学院院长李哈布教授,埃及艾因·夏姆斯大学中文系教授、著名汉学家、翻译家哈赛宁教授围绕这一话题展开对话。
9月15日播出的《这就是中国》主持人何婕携手埃及开罗大学中文系主任、孔子学院院长李哈布教授,以及埃及艾因·夏姆斯大学中文系教授、著名汉学家哈赛宁教授,与复旦大学中国研究院院长张维为教授共同对话,分享他们与中国的深厚缘分,带你从阿拉伯视角读懂中国,走进中阿文化交
英特尔、三星、台积电以及日本即将落成的先进晶圆代工厂Rapidus都计划在每平方毫米的硅片上放置更多晶体管,它们有一个共同点,那就是支撑其工作的极紫外(EUV)光刻技术极其复杂、非常昂贵且运营成本相当高昂。主要原因是,生产这种系统的13.5纳米光源的过程非常精